24.5 딥러닝과 최적화의 결합: 미분 가능한 최적화 24.5 딥러닝과 최적화의 결합: 미분 가능한 최적화 24.5.1 최적화 레이어(Optimization Layers): 신경망 내부에 QP 솔버 내장하기 (CvxPyLayers, OptNet) 24.5.2 종단간(End-to-End) 학습에서의 WBC: 정책 네트워크(Policy Network)가 토크 대신 최적화 비용 가중치(Cost Weights)를 출력하는 구조 24.5.3 하이브리드 아키텍처: 강화학습(RL)의 유연함과 WBC의 강건함(Robustness) 결합 사례